pytorch卷积操作nn.Conv中的groups参数用法解释

您所在的位置:网站首页 pop groups是什么意思 pytorch卷积操作nn.Conv中的groups参数用法解释

pytorch卷积操作nn.Conv中的groups参数用法解释

2024-07-07 03:04| 来源: 网络整理| 查看: 265

MobileNetV1《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》_程大海的博客-CSDN博客

《MobileNetV2: Inverted Residuals and Linear Bottlenecks》_程大海的博客-CSDN博客

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》_程大海的博客-CSDN博客

pytorch中MobileNetV2分类模型的源码注解_程大海的博客-CSDN博客

pytorch卷积操作nn.Conv中的groups参数用法解释_程大海的博客-CSDN博客_pytorch中groups

最近在项目中使用到了MobileNet分类网络,MobileNet网络中使用到了深度可分离卷积操作,深度可分离卷积将传统卷积操作分成两步来处理。假设输入的特征图feature_map大小为[H, W, C],深度可分离卷积第一步使用C组NxNx1的卷积核对每个输入通道in_channel进行卷积,卷积输出结果特征图feature_map大小为[H, W, C],然后使用M个1x1xC的卷积核进行卷积操作,输出的特征图大小为[H, W, M]。深度可分离卷积的目的是减少卷积操作的参数量和计算量,从而提升运算速度。深度可分离卷积表示如下图:

在MobileNet网络中有一步是要对每个通道进行单独的卷积操作,在pytorch实现的MobileNetV2代码中用到了nn.Conv函数的groups参数来完成逐个通道的卷积操作,如下图:

查询pytorch官方文档对于groups参数的解释,看的一脸懵逼???大概能看出来这玩意是用来对输入channel和输出channel进行分组的,具体怎么分组,分组后怎么计算,还是一脸懵逼???

先大概总结一下groups参数的含义:假设卷积操作的输入通道数是in_channels,输出通道数是out_channles,分组数是groups,分组卷积就是把原本的整体卷积操作分成groups个小组来分别处理,其中每个分组的输入通道数是in_channles / groups,输出通道数是out_channles / groups,最后将所有分组的输出通道数concat,得到最终的输出通道数out_channles,所以在做分组卷积的时候,in_channels和out_channels需要被groups整除

下面就自己动手来试验一下这个参数的用法:

1、首先定义卷积操作的输入数据:

# 输入数据的维度[N, C, H, W] -> [1, 4, 1, 1] # 输出通道数4 data = torch.arange(4, dtype=torch.float32).view(1,4, 1, 1) print(data)

自定义的输入数据长和宽都是1,有4个通道。长下面这个样子:

2、实验groups=1场景

kernel_weight = torch.nn.Parameter(torch.arange(16, dtype=torch.float32).view(4, 4, 1, 1)) print(kernel_weight) conv_groups_1 = nn.Conv2d(in_channels=4, out_channels=4, kernel_size=1, groups=1, bias=False) conv_groups_1.weight = kernel_weight conv_groups_1(data)

这里为了方便后续卷积结果的计算,我没有使用随机数产生的卷积核,使用了自定义的卷积核,并且卷积过程中没有使用bias。输出结果如下:

上图中红框中的内容是4个卷积核,绿色框中的内容是卷积结果。这些结果是怎么计算得到的呢?请看下图:

这是groups=1的场景,groups=1时只有一个分组,所有的输入通道分别和所有的卷积核进行卷积操作,生成卷积结果。下面看一下groups=2的场景。

3、实验groups=2的场景

kernel_weight_2 = torch.nn.Parameter(torch.arange(8, dtype=torch.float32).view(4, 2, 1, 1)) print(kernel_weight_2) conv_groups_2 = nn.Conv2d(in_channels=4, out_channels=4, kernel_size=1, groups=2, bias=False) conv_groups_2.weight = kernel_weight_2 conv_groups_2(data)

输出结果如下:

结果同上,红色框中是卷积核,绿色框中是卷积输出结果,可以发现groups=2时的卷积核通道数比groups=1时卷积核的通道数减少了一半。那上图的结果又是怎么计算出来的呢?请看下图:

这是groups=2的场景,groups=2时有2个分组,每个分组中包含2个卷积核,每组卷积核和2个输入通道进行卷积操作得到一组输出结果,将两组输出结果进行叠加得到最终的卷积结果。下面看一下groups=4的场景。

4、实验groups=4的场景

kernel_weight_4 = torch.nn.Parameter(torch.arange(4, dtype=torch.float32).view(4, 1, 1, 1)) print(kernel_weight_4) conv_groups_4 = nn.Conv2d(in_channels=4, out_channels=4, kernel_size=1, groups=4, bias=False) conv_groups_4.weight = kernel_weight_4 conv_groups_4(data)

输出结果如下:

结果同上,红色框中是卷积核,绿色框中是卷积输出结果,可以发现groups=4时每个卷积核只有1个通道。那上图中的结果又是怎么计算出来的呢?请看下图:

这是groups=4的场景,也是groups等于输入通道数的场景,也就是开头讲的深度分离卷积中的场景,groups=4时有4个分组,每个分组中包含1个卷积核,每组卷积核和1个输入通道进行卷积操作得到一组输出结果,将4组输出结果进行叠加得到最终的卷积结果。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3